La Recuperación de Información en español y la normalizacion de términos
نویسندگان
چکیده
Most of the Information Retrieval Systems uses counts of frequencies of the words that occur in documents. Such counts entail the need of normalizing these terms. A simple normalization of characters (upper/lowercase, accents and other diacritical ones) seems insufficient, since many words, by morphologic inflection or derivation, could be grouped under an only form, when having very near semantic mean. Several algorithms of normalization are analyzed and tested experimentally to evaluate their effectiveness.
منابع مشابه
Aplicación de Técnicas de Recuperación de Información a un Glosario de Términos de Internet Desarrollado Utilizando Tecnología JSP
Resumen. En este artículo se describe un sistema que facilita las consultas a un glosario de términos sobre Internet publicado por la Asociación de Técnicos de Informática (ATI). La aplicación permite el acceso a las definiciones de cualquiera de los términos, escritos tanto en inglés como en español. Además, se facilita el mantenimiento del glosario, permitiendo publicar automáticamente nuevos...
متن کاملOrnitología Virtual: Caracterizando a #Chile en Twitter
Este art́ıculo presenta un análisis de los tweets recolectados el 28 de Octubre de 2012, en el contexto de las elecciones municipales de 2012 en Chile. Dicho análisis se realiza mediante una metodoloǵıa basada en literatura previa, en particular en técnicas de recuperación de la información y de análisis de espacios de información. Como resultado, se determinan: 1) caracteŕısticas demográficas b...
متن کاملInformación colocacional y recuperación de la información
Este proyecto tiene como objetivo investigar la significación de la información colocacional en Recuperación de la información (RI). Una colocación es una relación entre dos unidades léxicas (UL) L1 y L2 tal que para expresar un significado específico en relación con L1 la elección de L2 no es libre (Mel' uk 1995). Así, para expresar el sentido 'hacer lo que está previsto que se debe hacer' en ...
متن کاملDistinción semántica de compuestos léxicos en Recuperación de información
Resumen: La consideración de sintagmas no parece producir mejoras significativas en los modelos clásicos de Recuperación de Información. En general, se acepta que los criterios de proximidad proporcionan mejores resultados que un criterio de adyacencia. El trabajo que se presenta explora la hipótesis de que no todos los compuestos léxicos deben considerarse de la misma forma. Se propone un proc...
متن کامل[Google: Searches, analyses and networking in the health care environment].
La enfermerı́a, como todas las disciplinas de las Ciencias de la Salud, se encuentra en constante cambio y requiere de un gran esfuerzo investigador y formativo por parte de sus profesionales para garantizar la mejor atención y los mejores cuidados. El acceso al mejor conocimiento cientı́fico disponible y las Tecnologı́as de la Información y Comunicación (TIC) juegan un papel fundamental en esta p...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Inteligencia Artificial, Revista Iberoamericana de Inteligencia Artificial
دوره 8 شماره
صفحات -
تاریخ انتشار 2004